مدل جدیدی برای جستجوی عبارت بر اساس کمینه جابه‌جایی وزن‌دار

نویسنده

چکیده مقاله:

Finding high-quality web pages is one of the most important tasks of search engines. The relevance between the documents found and the query searched depends on the user observation and increases the complexity of ranking algorithms. The other issue is that users often explore just the first 10 to 20 results while millions of pages related to a query may exist. So search engines have to use suitable algorithms with high performance to find the most relevant pages. The ranking section is an important part of search engines. Ranking is a process in which the web page quality is estimated by the search engine. There are two main methods for ranking web pages. In the first method, ranking is done based on the documents’ content (traditional rankings). Models, such as Boolean model, probability model and vector space model are used to rank documents based on their contents. In the second method, based on the graph, web connections and the importance of web pages, ranking process is performed. Based on researches on search engines, the majority of user queries is more than one term. For queries with more than one term, two models can be used. The first model assumes that query terms are independent of each other while the second model considers a location and order dependency between query terms. Experiments show that in the majority of queries there are dependencies between terms. One of the parameters that can specify dependencies between query terms is the distance between query terms in the document. In this paper, a new definition of distance based on Minimum Weighted Displacement Model (MWDM) of document terms to accommodate the query terms is presented. In the Minimum Weighted Displacement Model (MWDM), we call the minimum number of words moving a text to match the query term by space. In addition, because most of the ranking algorithms use the TF (Term Frequency) to score documents and for queries more than one term, there is no clear definition of these parameters; in this paper, according to the new distance concept, Phrase Frequency and Inverted Document Frequency are defined. Also, algorithms to calculate them are presented. The results of the proposed algorithm compared with multiple corresponding algorithms shows a favorable increase in average precision.  

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

بررسی میزان استفاده از اینترنت برای جستجوی اطلاعات سلامت در میان زنان بر اساس مدل پذیرش فناوری (TAM)

چکیده: زمینه و هدف: امروزه اینترنت به یکی از منابع مهم برای جستجوی اطلاعات سلامت تبدیل شده است که یکی از مهمترین گروه‌های استفاده کننده از آن برای جستجوی اطلاعات سلامت را زنان تشکیل می‌دهند. مواد و روشها: مطالعه حاضر یک پژوهش کمی از نوع توصیفی- تحلیلی است و استفاده از اینترنت برای جستجوی اطلاعات سلامت در میان زنان را با استفاده از مدل پذیرش فناوری مورد ارزیابی قرار داده است. ابزار مورد استفاده ...

متن کامل

امدادرسانی زمان‌مند بر اساس جستجوی فراکتال

پس از وقوع بحران، آمادگی برایامدادرسانی کارآمدنقشی اساسی در کاهش هزینه‌ها و تلفات انسانی احتمالی حادثه خواهد داشت. امدادرسانی به‌عنوان یکی از مهم‌ترین مراحل توسعه سامانه‌های مدیریت بحران شناخته می‌شود. به منظور توسعه رویکردی کارا برای امدادرسانی زمان‌مند، در این پژوهش به حل مسئله‌ای بر اساس مسئله مسیریابی موجودی با وضعیت چند دوره‌ای و چند کالایی پرداخته شده است. جهت حل مدل، از یک الگوریتم بهبود...

متن کامل

زیرگونه جدیدی از سنجد تلخ (Elaeagnus rhamnoides (L.) A.Nelson) برای ایران بر اساس داده‌های مولکولی

سنجد تلخ (Elaeagnus rhamnoides (L.) A.Nelson) گیاهی دارویی، مقاوم به خشکی، تثبیت‎کننده­ ازت و یک گونه پیش‌آهنگ جنگلی است. در این پژوهش برای اولین بار در ایران، شناسایی مولکولی سنجد تلخ در رویشگاه­های مختلف کشور و مقایسه­ آنها با زیرگونه­های شناخته شده در سایر نقاط جهان انجام شد. از پنج رویشگاه در استان­های البرز، مازندران، آذربایجان‌شرقی و غربی و قزوین نمونه­برداری انجام گردید. از نشانگر هسته­ا...

متن کامل

تعیین شاخص سوز باد استان اصفهان بر اساس دمای کمینه

آب و هوا تاثیر بسیار مهمی در حیات موجودات زنده کره زمین دارد. وزش باد با دما اثر تلفیقی احساس محیط را ایجاد می‌نماید، بطوریکه به کاهش دما همراه با باد، سوزباد و برعکس آن گرم باد اطلاق می‌شود. در این تحقیق سوزباد دمای کمینه در استان اصفهان مورد بررسی قرار گرفت. دمای کمینه و سرعت وزش باد برای 10 ایستگاه همدیدی استان طی دوره آماری 1372 تا 1394 از سازمان هواشناسی کشور تهیه گردید. نتایج نشان داد...

متن کامل

رشد درونزا: یک مدل جستجوی تصادفی برای فن آوری جدید

این مقاله رشد درونزا، بر پویایی مدلی در انباشت دانش تاکید دارد. با توجه به نا اطمینانی موجود در هر فرایند جستجو، مدل یک ساختار پویای تصادفی که در آن فن آوری و انباشت دانش مکمل همدیگر می باشند ارائه می‌کند که هر یک از دو موتور رشد انباشت سرمایه و فن آوری تا یک نقطه مکمل همدیگر می باشند و بعد از آن تاثیر هریک مقید به سطح دیگری است. نشان داده می‌شود که هر دو عامل انباشت سرمایه و پیشرفت فن آوری برا...

متن کامل

اصلاح مدل بیلان حجمی با بهبود عبارت ذخیره سطحی برای آبیاری جویچه ای

راندمان سیستمهای آبیاری سطحی در ایران بسیار پائین است. در صورتیکه بتوان پارامترهای مهم و موثر در طراحیآبیاری سطحی، از قبیل فرصت نفوذ و زمان پیشروی را در ازای یک دبی مشخصبه خوبی برآورد کرد، میتوانراندمان کاربرد این سیستم را به مقدار قابل توجهی افزایش داد. مدل بیلان حجمی یکی از مدلهای ساده و رایج درطراحی و ارزیابی آبیاری جویچهای میباشد. با توجه به فرضیاتی که در مدل بیلان حجمی اعمال میشود دقت این ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 15  شماره 4

صفحات  71- 84

تاریخ انتشار 2019-03

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023